EVENTO
Gypscie-Prov: Gerenciando a Proveniência no Ciclo-de-Vida de ML no Sistema do Gypscie
Tipo de evento: Defesa de Dissertação de Mestrado
O aumento da complexidade das aplicações de Machine Learning (ML) tem intensificado a necessidade de mecanismos que assegurem rastreabilidade, reprodutibilidade e auditabilidade ao longo de todo o ciclo-de-vida dos modelos. Apesar da existência de plataformas voltadas ao gerenciamento de experimentos, muitas soluções ainda registram informações de forma fragmentada, dificultando a compreensão integrada das dependências entre dados, processos e resultados. Neste contexto, este trabalho apresenta o Gypscie-Prov, uma abordagem baseada no padrão W3C PROV, para estruturar a proveniência de dados e processos ao longo do ciclo-de-vida de ML no sistema Gypscie. A proposta contempla a captura integrada de proveniência prospectiva e retrospectiva, estruturando tanto a definição dos fluxos analíticos quanto os registros das execuções realizadas ao longo do pipeline de ML. Os dados de proveniência são armazenados em um banco de dados NoSQL orientado a grafos, o Neo4j, permitindo a realização de consultas complexas, auditoria dos experimentos e navegação eficiente pelas dependências entre artefatos. Estudos preliminares indicam que a modelagem baseada em grafos apresenta desempenho superior para consultas típicas de proveniência quando comparada a abordagens baseadas em logs, contribuindo para maior transparência, governança e confiabilidade em aplicações de ML.Evento HíbridoLocal: Auditório ALink de Transmissão: meet.google.com/rvj-vjdc-ekf
Data Início: 26/02/2026 Hora: 09:00 Data Fim: 26/02/2026 Hora: 12:00
Local: LNCC - Laboratório Nacional de Computação Ciêntifica - Auditorio A
Aluno: Júlia Neumann Bastos - - LNCC
Orientador: Fabio André Machado Porto - Laboratório Nacional de Computação Científica - LNCC
Participante Banca Examinadora: Bernardo Nunes Gonçalves - Laboratório Nacional de Computação Científica - LNCC Eduardo Soares Ogasawara - Centro Federal de Educação Tecnológica Celso Suckow da Fonseca - CEFET-RJ Fabio André Machado Porto - Laboratório Nacional de Computação Científica - LNCC Vanessa Braganholo Murta - Universidade Federal Fluminense - IC/UFF
Suplente Banca Examinadora: Antônio Tadeu Azevedo Gomes - Laboratório Nacional de Computação Científica - LNCC


